Isomap y LLE para ordenación de imágenes por sus grados de libertad

EN esta primera parte de la práctica vamos a usar Isomap y LLE para disponer imágenes de personajes conocidos sobre un mapa bidimensional. Lo interesante de este ejercicio es que manejamos puntos de alta dimensionalidad (cada pixel es una característica del punto) y que Isomap y LLE son capaces de extraer los 'grados de libertad de la imagen', entendiendo por éstos las características visuales propias de los objetos representados (perfiles, intensidad luminosa, forma del objeto, poses,...).

Vamos a utilizar la base de datos que python ha incorporado a partir de la base de datos original 'Labeled Faces in the Wild'. Esta es una base de datos de 13000 imágenes de caras de 1680 personas (muchas con 2 o más fotos en ella). Puedes consultar la base de datos original en http://vis-www.cs.umass.edu/lfw/

Las imágenes se representan por su lista de valores de color de sus pixeles, son por tanto, vectores de alta dimensionalidad.

Andreu Cantó y Amparo Gálvez

Vamos a plotear varias imágenes para hacernos una idea del dataset. Las imágenes las hemos transformado a niveles de gris.

Como se ve de las dimensiones que hemos impreso, hay 2370 imágenes de tamaño 62x47 pixeles = 2914 características (variables) que representan la intensidad de gris.

Vamos a coger un único personaje (George Bush) y vamos a procesarlo con Isomap para hallar las disposiciones de sus fotos en un espacio 2D. Veamos que estructura es capaz de encontrar.

Primero defino una función para poder plotear las imágenes en el plano según sus coordenadas

Actividad 1: Parte 1: Explica en este contexto el uso de Isomap respondiendo a estas preguntas: +a) ¿Con qué valores calculamos la distancia entre dos elementos, es decir, qué son las características de los datos?

La características de los datos son el nivel de gris que tiene cada píxel de la imagen (2914 cracaterísticas).

+b)¿Qué significa que dos imágenes están cerca?

Significa que comparten similitudes estructurales en el conjunto de datos original, es decir, las imagenes son similares, y esa similitud se conserva en la representación reducida de Isomap.

+c)¿Vamos a conocer en algún momento qué forma o expresión matemática tiene la supuesta variedad donde están alojadas las imágenes? ¿Conocemos su dimensión intrínseca?

No necesariamente hace falta conocer la expresión matemática. Isomap no requiere conocer explícitamente la forma o expresión matemática de la variedad subyacente. En lugar de eso, se basa en la estructura de vecindad para aproximar la distancia geodésica entre puntos en la variedad.

Isomap busca determinar la dimensión intrínseca de una variedad al encontrar una representación de baja dimensión que capture las relaciones geodésicas entre los puntos en dicha variedad. La dimensión intrínseca se obtiene a partir del número de componentes principales retenidos en el proceso de reducción de dimensionalidad.

+d)¿Contienen los puntos hallados en el espacio embebido parte de la información original (intensidad de grises)? ¿Qué son esos puntos según la teoría en que se basa Isomap?

Los puntos en el espacio resultante son básicamente una versión comprimida de la información original de las imágenes, especialmente las tonalidades de grises. La idea es que esta representación en un espacio más pequeño mantiene las relaciones especiales entre los puntos originales. Al conservar estas relaciones, obtenemos una representación que guarda las características importantes de las imágenes y las complicadas conexiones entre los datos.